DiSeg: Un segmentador discursivo automático para el español

نویسندگان

  • Iria da Cunha
  • Eric SanJuan
  • Juan-Manuel Torres-Moreno
  • Marina Lloberes
  • Irene Castellón
چکیده

Nowadays discourse parsing is a very prominent research topic. However, there is not a discourse parser for Spanish texts. The first stage in order to develop this tool is discourse segmentation. In this work, we present DiSeg, the first discourse segmenter for Spanish that uses the framework of the Rhetorical Structure Theory (Mann and Thompson, 1988) and is based on lexical and syntactic rules. We describe the system and we evaluate its performance with a gold standard corpus, obtaining promising results.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Poblado automático de ontologías de perfiles académicos a partir de textos en español

Resumen. Este artículo propone un enfoque para el poblado automático de ontologías de perfiles académicos a partir de los textos, expedientes curriculares y resúmenes, de publicaciones científicas en español. El enfoque utiliza reglas semánticas y marcadores lingüísticos para extraer los individuos de clase, relaciones y valores de propiedad. Una evaluación ha sido realizada con un conjunto de ...

متن کامل

Una Propuesta para el Etiquetado Automático de Roles Semánticos

Resumen: La identificación de los roles semánticos es una parte crucial en tareas que involucran tratamiento automático del lenguaje natural como la extracción y recuperación de información, sistemas de búsquedas de respuestas, generación de resúmenes, traducción automática, etc. Para el caso del español, la investigación en roles semánticos es escasa. El objetivo del actual trabajo es analizar...

متن کامل

Arquitectura Web para análisis de sentimientos en Facebook con enfoque semántico

Resumen Actualmente el potencial del análisis automático de sentimientos en redes sociales es relevante en el desarrollo de aplicaciones para múltiples propósitos. En este sentido, las publicaciones en Facebook escritas en español pueden contener información semántica relevante que permitiŕıan clasificarlas en categoŕıas de emociones, la complejidad del idioma hace que el análisis de esta infor...

متن کامل

Impacto de la ironía en la minería de opiniones basada en un Léxico Afectivo

En este art́ıculo se describe un método sistemático que identifica la polaridad de textos en Español, aśı como el impacto de la irońıa en la mineŕıa de opiniones. Se propone una aproximación basada en un aprendizaje automático y en la extracción de caracteŕısticas a partir de un Léxico Afectivo en Español. Fue necesaria la creación de un corpus para el entrenamiento y evaluación del método propu...

متن کامل

Sistema automático para la clasificación de la opinión pública generada en Twitter

Resumen. La facilidad de acceso a la diversidad de contenidos hace de Twitter un medio para pronunciarse sobre temas actuales o eventos en tiempo real. Los usuarios de esta red no cumplen únicamente una función pasiva de recepción y consumo de información, sino que al mismo tiempo se convierten en productores de contenidos. El estudio de tuits requiere de una disciplina que permita trabajar con...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 45  شماره 

صفحات  -

تاریخ انتشار 2010